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摘要 :明确 野生 动 植物 的 地 理 分 布 是 基础 生态 学 和 应 用 生态 学 领域 的 一 个 基础 但 关键 的 步骤 ,为 后 续 分 析 提 供 了 重要 的 信息 。 
而 野生 动 植物 分 布 调查 是 一 项 需要 投入 大 量 人 力 ,精力 和 资金 的 工作 ,特别 是 稀有 物种 的 调查 。 物 种 分 布 模型 越 来 越 受 到 广泛 
引用 尤其 是 在 生物 保护 方面 。 为 了 证 明 物 种 分 布 模型 在 野生 生物 调查 中 精确 采样 方法 的 可 行 性 ,以 全 球 易 危 物种 黑人 颈 稚 和 白 
头 稚 的 实际 繁殖 分 布 预测 为 例 ,使 用 随机 森林 (Random Forest) 算法 加 以 验证 。 比 较 发 现 物种 分 布 模型 预测 实际 调查 分 布点 , 随 
Ce s 间 相对 出 现 概率 具有 显著 差 虹 kP<0.001) ,实际 分 布点 具有 较 高 的 相对 出 现 
概率 。 该 结果 表明 若 在 物种 分 布 相对 出 现 概率 较 高 区 域 设 置 样 方 能 够 减少 实际 调查 区 域 , 有 效 提高 发 现 目 标 物种 的 概率 ,从 而 
st 基于 物种 分 布 模型 的 精确 采样 方法 将 有 效 地 提高 我 们 对 稀有 物种 分 布 的 了 解 ,有 利于 野生 动 植物 的 保护 规划 。 
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Abstract: The identification of the geographic distribution of wildlife is fundamental in applied ecology, since it provides 
important information for subsequent analyses. However, the investigation of wildlife is often expensive and time consuming, 
especially for. rare species and when using inefficient sampling designs. To determine target species more efficiently, we 
tried.to apply model-based sampling using predictions from species distribution models ( SDMs). We used black-necked 
Grus nigricollis) and hooded ( Grus monacha) cranes as two examples, and used the Random Forest algorithm combining 
the breeding location and environmental information to model the breeding geographic distribution of the two crane species. 
We extracted the relative index of occurrence ( RIO) for the breeding locations (testing points, model-based sampling 


method) , random point locations ( random sampling method) , and regular point locations ( regular sampling method) from 
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the prediction map. Then, we used boxplots and ANOVA to analyze these data; the results indicated breeding locations with 
higher RIOs, and a significant difference was found between the other two methods. Therefore, the model-based sampling 
method helped to reduce the size of the investigated areas and determine target species more effectively. To conclude, a 
species distribution model-based sampling method for fieldwork would help to increase our knowledge of rare species 


distributions. More generally, we recommend using this approach to support conservation plans. 


Key Words: species distribution model ( SDM) ; Random Forest; sampling method; black-necked crane; hooded-erane 


明确 物种 的 空间 分 布 是 许多 保护 工作 如 虫害 防治 ,保护 区 建设 的 首要 工作 。 野 外 调查 野生 物种 尤其 
是 稀有 物种 是 一 项 需要 投入 大 量 人 力 时间 和 资金 的 艰巨 任务 。 使 用 传统 样 方 法 和 样 线 法 调查 野 符 物种 时 由 
于 其 数量 稀少 ,大 多 数 样 方 内 并 不 能 找到 相应 物种 ,所 以 样 方 的 设计 需要 和 物种 分 布 情况 相 适应 ; 而 对 于 
某 一 物种 分 布 情况 的 了 解 程 度 常 受 限 于 是 否 有 专家 可 以 咨询 以 及 由 于 专家 所 处 位 置 的 地 理 限 制 而 造成 的 知 
识 偏 见 沾 。 因 此 ,有 助 于 在 野外 快速 而 有 效 地 发 现 特定 目标 物种 的 方法 具有 重要 的 实用 价值 。 
物种 分 布 模型 ( Species distribution models,SDMs ) 或 生态 位 模型 ( Ecologieal niehefmodels) 上 ,是 将 物种 的 
分 布 信息 和 对 应 的 环境 变量 信息 依据 一 定 的 算法 得 出 物种 分 布 与 环境 变量 之 间 的 关系 ,并 将 这 种 关系 应 用 于 
所 研究 的 区 域 , 进 而 对 目标 物种 分 布 进行 估计 的 模型 …“ 。 物 种 分 布 模型 越 来 越 成 为 生态 学 ,生物 地 理学 , 保 
cuo 护 生 物 学 1 ,影响 评价 ,气候 变化 研究 ”2 的 一 个 重要 研究 工具 。 物 种 分 布 模型 在 生物 保护 方面 的 其 中 一 
lo “个 重要 应 用 是 为 稀有 和 濒危 物种 制作 空间 分 布 图 ,了 解 这 些 特 种 在 哪些 区 域 更 可 能 出 现 呈 ”1 。 
eo ASIE (Grus nigricollis ) 是 世界 15 Ph £5 25 rp ME — 4E Ti dE m JH] 8 285, gi IUCN 列 为 全 球 易 危 物种 
— — (〈(VU)59 。 黑 颈 稚 是 锥 科 中 科学 纪录 最 晚 的 一 个 种 ,俄国 钦 险 家 Przhevalsky 于 1876 年 在 青海 湖 取 得 标本 ,但 
c 自 此 以 后 的 100 多 年 来 ,人 们 对 黑 颈 稚 的 状况 几 笠 是 一 无 所 知 " 5 。 近 40 年 来 , 黑 颈 稚 的 研究 取得 迅速 进展 ， 
d 积累 了 较 丰 富 的 资料 。 黑 颈 锥 目前 种 群 数量 约 L1000 只 ,繁殖 地 点 相对 集中 于 西藏 中 西部 .青海 东部 ,四 川北 
三 部 1 ,甘肃 南部 和 北部 。 同 时 ,有 小 部 分 种 群 分 布 于 不 丹 和 印度 !5] AKES (Grus monacha ) 被 IUCN 列 为 易 
和 危 物 种 (VU) ,目前 全 球 数 量 为 11160 只 中 。 白 头 稚 繁殖 于 俄罗斯 西伯 利 亚 东南 部 以 及 黑龙 江 流 域 ;大 部 
性 分 个 体 越冬 于 日 本 南部 鹿 儿 岛 地 区 况 外 有 少量 个 体 越冬 于 韩国 和 我 国 的 长 江 中 下 游 地 区 。 白 头 锥 的 第 一 个 
C 繁殖 集 于 1974 年 在 俄罗斯 被 发 现 " 溃 ,在 我 国 首 个 白头 匆 繁 殖 集 在 1993 年 黑龙 江 小 兴安 岭 地 区 的 通 北 
dil u^ 
虽然 物种 空间 预测 分 布 图 已 被 应 用 于 诸多 领域 ,如 保护 区 规划 ,但 是 空间 预测 结果 的 可 信和 性 尚未 被 野外 
调查 真实 数据 充分 证 明 。 基 于 此 ,本 文 以 易 危 物种 黑 颈 鹤 和 白头 鹤 的 繁殖 空间 分 布 预测 为 案例 ,采用 随机 条 
林 模 型 算法 来 评 佑 基于 物种 分 布 模型 的 精确 采样 方法 的 有 效 性 和 可 行 性 。 


1 材料 和 方法 


1.1“ 和 研究 区 域 

根据 现 有 的 黑 颈 鹤 和 白头 稚 繁 殖 分 布点 ,将 其 所 在 位 置 作为 主体 ,再 向 外 延伸 一 定 距 离 作 为 研究 区 域 ， 
MEEI DX Jk JJ 789 13'—104254'E,25?40'—42?31'N ; A KEWA DX Jk JJ. 120?20'—145255'E,43?18'—56?17' 
NCE 1), 
1.2 物种 数据 

在 2002—2014 年 间 ,通过 收集 文献 资料 和 当地 居民 提供 的 黑 颈 稚 信 息 ,借助 高 倍 望远镜 辅 以 实地 地 毯 式 
调查 。 记 录 观 察 点 经 纬度 , 黑 颈 稚 距 观察 点 的 角度 和 距离 ,然后 确定 黑 颈 鹤 出 现 位置 经 纬度 信息 , 共 收 集 到 黑 
ES SEP ER 58 个 ,在 本 研究 中 作为 黑人 颈 知 模型 的 训练 点 ;调查 范围 包括 甘肃 青海 和 四 川 三 省 ,基本 涵盖 已 知 
的 黑 颈 锥 所 有 繁殖 分 布 区 。2014 年 在 西藏 南部 的 定 结 定 日 县 湿地 发 现 17 个 黑人 颈 知 繁殖 点 , 系 为 首次 调查 发 
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图 1 黑 颈 鹤 和 白头 窟 研究 区 图 ,其 中 红 点 表示 建立 模型 所 用 的 训练 点 , 黑 点 表示 验证 模型 准确 度 的 验证 点 
Fig.l The study area of Black-necked Crane and Hooded Crane. Red dots display the Training samples used to construct species 


distribution models, black dots display the Test samples used to evaluate model accuracy 


H KRME S USES SC I E s. 2002—2014 4E [R]iz FE] SECERUIES S] d FR I] 27 22s E nP EUR AI Hc A A ES 
BIR 33 个 ,本 研究 中 作为 白头 稚 模 型 训练 点 ;这 些 点 涵盖 已 知 的 国内 所 有 繁殖 分 布 区 。2014 年 利用 GPS- 
GSM 卫星 跟踪 器 对 白头 鹤 跟 踩 上 中 繁殖 期 间 个体 移 动 速度 为 0 的 跟踪 点 大 量 聚 集 (>200) 在 一 个 半径 为 2 一 
3km 的 区 域 , 则 将 访 区 域 中 心经 第 度 作为 繁殖 点 。 以 此 在 俄罗斯 境内 共 发 现 繁殖 点 12 个 ,在 本 研究 中 作为 白 
头 稚 模型 的 验证 点 (图 1) 
1.8 ”环境 变量 

选取 了 21 ARA HESS Jy 30 弧 秒 的 环境 变量 作为 模型 自 变 量 ,包括 4 个 地 形 地 理 变 量 (海拔 坡度 、 坡 向 、 离 
海岸 线 距离 妃 2 个 水 源 变 量 ( 离 河流 距离 离 湖 泊 距 离 ),3 个 人 为 干扰 变量 ( 离 公路 距离 离 铁 路 距离 离 居民 
点 距离 ) ,下 合生 地 覆盖 因子 ,11 个 生物 环境 气候 变量 ( 表 1) 。 
Yy4 pOWEY 

本 研究 选择 随机 森林 (Random Forest ^" ) 作为 物种 分 布 模型 算法 。 选 择 随 机 森林 模型 是 基于 其 出 色 的 预 
测 能 力 和 被 研究 人 员 广 泛 应 用 "一 。 随 机 森林 是 一 种 相对 新 颖 的 机 器 学 习 方 法 ,属于 组 合 模型 (Ensemble 
models) 的 一 种 。 其 基本 算法 思想 是 :假设 建 模 人 知道 单个 分 类 树 的 构建 ,随机 森林 通过 自 举 法 (bootstrap ) Bf 
机 选择 变量 生长 成 分 类 “ 树 ” ,每 棵 树 都 会 完整 生长 而 不 作 修剪 (pruning) 。 并 且 在 生成 树 的 时 候 , 每 个 节点 的 
变量 都 仅 由 随机 选 出 的 几 个 变量 中 产生 :5 。 一 般 情 况 下 ,随机 森林 随机 地 生成 几 百 个 至 几 千 个 分 类 树 ,然后 
选择 重复 程度 最 高 的 树 作 为 分 类 和 回归 的 最 终结 果 '*i。 随 机 森林 能 够 得 到 很 高 的 预测 准确 性 而 不 产生 过 拟 
合 现象 ”1 ,然而 这 点 尚 有 争议 ':* 3 。 本 研究 使 用 Salford Predictive Modeler (SPM) 软 件 中 的 Random Forest 
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算法 构造 模型 及 分 布 于 预测 。SPM 软件 对 随机 森林 模型 进行 了 内 部 优化 ”| 。 


RI 环境 变量 图 层 描 述 


Table 1 GIS layers for environmental variables 


do un Bi (均值 :标准 差 ) 。 (均值 :标准 差 ) 来 源 网 站 
layer Description Black-necked crane Hooded Crane Source Website 
(Mean+SD ) (Mean+SD) 
Bio 1 年 平均 气温 49.24 + 90.55 -18.21 + 41.77 WorldClim http ;// worldclim.org/ 
Bio 2 月 平均 昼夜 较 差 134.9 + 20.00 119.00 + 19.69 — WorldClim http ;// worldclim.org/ 
Bio 3 d I 0 温度 36.54+5.63 21.48+2.24 WorldClim http://worldelim.org/ 
Bio_4 温度 季节 性 变异 8406.00 + 2433.64 15108 + 2033.68 WorldClim http ;//worldclim.org/ 
Bio 5 年 最 高 气温 223.20 + 90.65 236.30 + 30.07 WorldClim http ;// wórldclim.orgZ 
Bio 6 年 最 低 气 温 -149.70 + 103.95 -304.60 + 68.34  WorldClim http ;// worldclim:org/ 
Bio 7 气温 年 较 差 372.90 + 79.98 541.00 + 68.40 — WorldClim 
Bio, 12 年 降水 量 247.00 + 610.25 618.90 + 147.04 — WorldClim http: // wotldelim.org/ 
Bio, 13 最 湿润 季节 降水 量 113.30 + 144.01 135.80 + 21.99 — WorldClim http£// worldclim.org/ 
Bio 14 最 干燥 季节 降水 量 2.65 + 3.98 9.20 + 9.32 WorldClim http ;Z/worldclim. org/ 
Bio 15 降水 季节 性 变异 98.37 + 16.99 85.05 + 21.01 — WorldClim http ;// worldclim. org/ 
Altitude 海拔 2908.00 + 1762.89 465.90 + 335.87  WorldClim http ; // worldclim.org/ 
Aspect 坡 向 174.45 x107.32 175.60 + 103.93 ”来 自 海拔 图 层 = 
Slope 坡度 4.39 + 5.43 2.33 +24% ”来 自 海拔 图 层 一 
Landcover TH as = p ESA http ;//www.esa-landcover-cci. org/ 
Disroad 离 公路 距离 37.95 + 41.82 79.00 3113.73 euin s xa http ;//www.naturalearthdata.com/ 
Disrard 离 铁 路 距离 260371 + 219608.5 — 104.72,3 139.21 铁路 图 层 来 自 http ;// www.naturalearthdata.com/ 


Natural Earth 


` 河流 图 层 3 
Disriver 离 河流 距离 122.76 + 136.76. 91.10 + 69.33 河流 图 层 来 日 http ://www.naturalearthdata.com/ 
Natural Earth 


S 湖泊 图 层 3 
Dislake 离 湖 泊 距 离 32849it 239.73 344.41 + 209.21 湖泊 图 层 来 自 http://www.naturalearthdata.com/ 
Natural Earth 


Coastline layer from 


Discoastline 离 海 岸 线 距 离 1515.49 + 549.06 664.38 + 459.82 http ;//www.naturalearthdata.com/ 
Natural Earth 
b 点 2 

Dissettle 离 居 民 点 距离 226.04 + 166.37 180.20 + 170.97 居民 点 图 层 来 自 http ://www.naturalearthdata.com/ 


Natural Earth 


分 别 在 黑 颈 稚 各 白头 稚 的 研究 区 内 生成 10000 个 “ 伪 不 存在 ( Pseudo-absence) " 4, JH Geospatial 
Modeling Environment ( GME ) 软件 分 别 为 两 个 物种 的 分 布点 和 “ 伪 不 存在 点 ”提取 21 个 环境 变量 信息 ,然后 用 
Salford Predictive Modeler (SPM) 软件 建立 预测 模型 。 模 型 设置 1 000 棵 树 ,权重 为 平衡 ( Balance) ,其 他 设置 
选择 默认 。 

为 本 进行 空间 预测 ,用 GME 软件 分 别 在 黑 有 颈 智和 白头 知 研 究 区 域内 生成 5 kmx5 km 规则 格 网 点 (regular 
points), 同时 提取 经 纬度 和 21 个 环境 变量 信息 。 使 用 SPM 软件 将 之 前 生成 的 黑人 颈 稚 和 白头 锥 模型 文件 预测 
每 准 格 网 点 的 适宜 分 布 指数 ,然后 在 ArcGIS 10.1 中 使 用 反 距 离 加 权 方 法 (Inverse Distance Weighted, IDW ) 插 
值得 到 预测 图 。 

15 模型 验证 和 分 析 

本 研究 使 用 AUC (area under the curve of receiver operator characteristic (ROC) curves ) [i£ 7?" 3e PE fpi 
型 ,因为 AUC [E As 32 B3 (ELE , C Z 9 FI UR If BC YE REO. AUC PEDHSUS Spe 
是 : 极 好 ,0.90 一 1.00; 好 ,0.80 一 0.90; 一 般 ,0.70 一 0.80; 差 ,0.60 一 0.70; 失 败 ,0.50 一 0.60。 使 用 SPM 软件 分 别 
计算 黑 颈 稚 和 白头 鹤 验 证 点 和 在 研究 区 域内 生成 的 100 个 随机 点 的 相对 出 现 概率 ,然后 利用 R 软件 的 
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SDMTools 包 计算 AUC 值 。 此 外 ,为 了 比较 基于 物种 分 布 模型 进行 采样 设计 的 方法 与 传统 取样 方法 的 差异 ， 
在 黑 颈 稚 和 和 白头 鹤 的 研究 区 内 分 别 生成 50 kmx50 km 的 格 网 点 用 来 模拟 系统 采样 ,并 比较 验证 点 ,100 个 随 
机 点 (模拟 随机 采样 ) 和 规则 点 的 相对 出 现 概率 。 


2 结果 分 析 


2.4.4 AUC 模型 评价 结 
NUES BERI I] AUC. 值 为 0.74, 白 头 鹤 模型 的 AUC 值 为 0.75。 根 据 Swets "Il Allouche 4205! 的 分 级 , 横 
型 准确 度 属 于 一 般 等 级 (Fair) 。 
2.20 ”模型 准确 性 空间 分 析 
图 2 展示 了 黑 贷 知 和 白头 稚 的 预测 分 布 图 。 从 图 中 可 以 看 到 验证 点 很 好 地 对 加 在 预测 到 的 通 宜 分 布 区 
范围 内 。 尤 其 是 白头 稚 验 证 点 很 好 的 覆盖 在 狭长 的 高 适宜 分 布 区 域内 。 比 较 验 证 点 ,随机 点 和 规则 点 所 在 位 
置 的 相对 出 现 概率 值 (图 3) ,发 现 验证 点 的 出 现 概率 要 远 高 于 随机 点 和 规则 点 ,方差 分 析 表 明 具 有 显著 差异 
(P<0.001) 。 
SUE CONI E EEE SME] 


30° 


80° 85° 90° 95° 100°E 


2. RES UU E A A 39 390 307 ES] 
Fig.2 Prediction maps of two cranes. prediction map of Black-necked Crane and prediction map of Hooded Crane 


其 中 红 点 表示 建立 模型 所 用 的 训练 点 , 黑 点 表示 验证 模型 准确 度 的 验证 点 


3 ”讨论 和 结论 


本 研究 结果 表明 利用 物种 分 布 模型 预测 到 黑 颈 稚 和 白头 稚 实 际 分 布点 验证 点 的 物种 相对 出 现 概 率 要 高 
于 传统 的 随机 采样 方法 ,系统 采样 方法 设计 的 采样 点 的 出 现 概率 ,并 具有 显著 差异 (P<0.001)。 说 明 物 种 分 
布 模型 具有 很 好 的 识别 物种 真实 分 布 的 能 力 。 借 助 于 物种 分 布 模型 将 物种 出 现 概率 高 的 区 域 作 为 实际 需要 
调查 网 域 ,将 天 大 缩小 实际 需要 调查 的 区 域 ,进而 提高 了 调查 效率 “| ,从 而 减少 调查 投入 ,为 野外 调查 提供 了 
二 个 有 效 而 可 靠 的 工具 。 

以 往 研究 中 对 物种 分 布 模型 或 生态 位 模型 的 验证 往往 是 从 总 体 样 本 中 选取 部 分 样本 用 于 验证 ”|， 
而 本 研究 的 验证 数据 与 训练 数据 来 源 不 同 ,并 不 是 从 总 体 中 选取 部 分 , 且 大 都 位 于 训练 数据 围 成 的 不 规则 区 
域外 ,距离 远 于 训练 数据 内 部 距离 。 与 来 源 于 与 训练 数据 同一 数据 集 的 部 分 样本 来 评价 模型 的 方法 相 比 更 为 
客观 ,对 模型 验证 更 具有 说 服 力 ,虽然 模型 准确 度 系数 会 相对 偏 低 。 

本 研究 的 研究 对 象 为 黑 颈 稚 和 白头 稚 繁 殖 分 布 了 预测 , 黑 颈 锥 和 白头 稚 分 别 在 高 原 湿地 和 森林 沼泽 区 域 繁 
殖 , 环 境 差 异 大 。 在 2002—2014 年 间 共 调查 得 到 75 个 黑 贷 智 繁 殖 点 和 45 个 白头 智 繁 殖 点 ,数据 获取 困难 。 
所 建 模型 基于 的 样本 数 分 别 为 58 个 和 33 个 ,属于 小 样本 模型 ,但 是 对 实际 调查 所 获得 的 验证 数据 仍 具有 很 
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3 黑 颈 鹤 和 和 白头 鹤 随 机 点 ,规则 点 和 验证 点 比较 的 箱 线 图 


Fig.3 Boxplots of Random points and Regular points versus Testing points for Black-necked Cranes and Hooded Cranes 


好 的 预测 能 力 。 说 明 利 用 物种 分 布 模型 方法 对 濒危 物种 和 分 布 数据 难以 获取 如 偏远 区 域 和 难以 到 达 区 域 ， 
像 本 研究 的 两 个 例子 ) 的 物种 的 调查 以 及 保护 规划 将 起 到 巨大 作用 。 

本 文 只 选取 随机 森林 算法 作为 物种 分 布 模型 , 这 是 因为 在 前 期 于 作 中 发 现 相 较 于 TreeNet (Stochastic 
Gradient BoostingL38l ) , CART (Classification and Regression Tree?!) , Maxent ( Maximum Entropy Models ^" ) 和 
4 种 模型 的 组 合 模型 ， 随 机 森林 模型 对 小 样本 具有 更 好 的 预测 能 力 。 不 同 物种 的 生活 环境 不 同 , 异 质 性 不 同 ， 
不 同 物种 的 空间 预测 基于 的 基础 单元 (grid) 是 否 也 需 不 同 $ 以 及 环境 变量 不 同 需要 在 未 来 继续 研究 。 本 研究 
的 结论 有 助 于 物种 分 布 模型 方法 在 实际 保护 规划 和 物种 调查 中 尤其 是 濒危 物种 的 应 用 。 
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